草庐IT

python - FIXML python 解析器

全部标签

iphone - 将 HTML 解析为 XML 的最佳方式

基本上,我目前有一个iPhone应用程序可以在我的服务器上查询和解析XML文件。现在,我目前必须每天早上手动更新和上传我的XML文件,以便我的用户可以获得更新的信息。我想使这个过程自动化,这基本上需要解析各种网站(NYTimes、iAmBored.com等),将每个网站的相关信息输出到一个XML文件,然后将该文件上传到我的服务器。有谁知道完成此任务的最佳方法(将HTML解析为XML文件)。由于我是初学者,我不确定这需要什么语言或者最好的方法是什么?提前致谢! 最佳答案 你可以试试translateHTMLtoXHTML(XHTML基

python - dateTime 提示 XSD 验证中的空白 (lxml)

我正在尝试使用XSD验证文档,而lxml提示dateTime值中的空白(尽管它应该折叠它)。我不确定这是否是一个错误的行为,或者我是否只是在XSD中指定了错误的地方。花了一个小时尝试对此进行调试,希望其他人之前经历过类似的行为。======================================================================ERROR[0.076s]:test_exports(disqus.importer.tests.tests.SchemaValidation)----------------------------------------

java - xml解析问题

我正在从xml文件中获取一些文本URLurl_Twitter=newURL("http://twitter.com/statuses/user_timelineID_PROVA.rss");HttpURLConnectionconn_Twitter=(HttpURLConnection)url_Twitter.openConnection();DocumentBuilderFactorydocumentBF_Twitter=DocumentBuilderFactory.newInstance();DocumentBuilderdocumentB_Twitter=documentBF_T

php - 使用 Regex 解析 XML/XHTML 数据

我读过著名的帖子。我已经看到了有限的成功和失败的尝试。哦,这里和其他地方的火焰war。但这是可以做到的。虽然我知道实际的论点(阅读事实)是正则表达式不适合解析结构化数据树,因为它们无法监控和更改状态,但我觉得有些人盲目地放弃了这种可能性。应用程序逻辑是保持状态所必需的,但正如这个有效示例所示,它是可以做到的。相关片段如下:constPARSE_MODE_NEXT=0;constPARSE_MODE_ELEMENT=1;constPARSE_MODE_ENTITY=3;constPARSE_MODE_COMMENT=4;constPARSE_MODE_CDATA=5;constPARSE

ruby-on-rails - 如何使 ActiveResource XML 解析更加一致?

我正在使用ActiveResource来使用Redmine(一种错误跟踪工具)提供的REST网络服务。该网络服务生成如下所示的XML:FredFake0FranFraud0Bug2但是,当ActiveResource解析它时,我遍历打印出的结果,我得到:FredFake0FranFraud#0Bug###2没错,它从任何有值的元素中抛出所有属性信息,但保留空元素中的属性信息。不用说,当您试图找到id15(或其他)的值时,这会让事情变得相当困难。现在我可以通过它们的位置来引用事物,但这非常脆弱,因为这些元素将来可能会发生变化。我假设必须有某种方法可以让ActiveResource保留属性

xml - 如何构建 XML 解析器?

谁能指导我找到有关构建XML解析器的优秀教程?我知道大多数语言已经有库来完成这项任务,但我有兴趣了解XML的语法和解析器工作原理背后的理论。我曾尝试搜索可以解释这一点的内容,但一直找不到任何内容。 最佳答案 为了清楚起见,您应该永远不要尝试编写用于生产的XML解析器。这是对大多数人来说太复杂了,而且真的很难做到正确并且解决了几乎任何语言的问题。为了获得XML的概述,我建议您阅读O'Reilly上的“XMLInANutshell”并尝试使用XML和XML转换来做一些事情。对于通用解析器构建,ParsingTechniques看起来很有

python - ElementTree XPath 奇怪的行为

你好我在Python2.7中使用ElementTree(1.3)并享受XPath功能,然而,其中一个搜索结果让我感到惊讶。我的XML示例:问题一:当我使用findall获取第一个找到的元素时version="2.2.0.0"found=list(txml.findall(".//BackEnd[@version='%s']"%version))returnfoundandfound[0]orNone它什么也没找到。然而,当我更改XML文件时,BackEnd元素包含子元素,然后正确找到搜索到的元素。你遇到过这样的行为吗?我是不是做错了什么或者这是ElementTree实现中的错误?问题二

xml - grails test-app -xml -coverage 尝试解析 XML URI 并超时

我在代理后面,我需要grailstest-app-xml-coverage不解析它试图解析的任何XML字段并且不连接到互联网。知道如何让它工作吗?我需要将代理设置为不才能使测试正常工作。 最佳答案 根据@RobHruska的评论,此问题已解决。JIRAissue 关于xml-grailstest-app-xml-coverage尝试解析XMLURI并超时,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com

python - 如何使用任何 xml 库替换节点的全部内容?

我正在尝试使用Python解析xml文件,但我有一些标签可能包含xml数据。例如:我想这样写CDATA标签:]]>我试过(使用lxml):a=etree.fromstring(data)foreina.findall("code"):e.text=etree.CDATA(etree.tostring(e))但是我得到:]]> 最佳答案 您的替换代码找到了元素并将其序列化为元素的新文本​​。您似乎只想包含的子元素,虽然。尝试设置e.text至CDATA(e.text)而不是序列化e的结果.

javascript - 用于使用命名空间解析 XML 的 JavaScript 库?

我有一些代码使用DOM来解析和遍历一些XML数据。它在Gecko和WebKit上运行良好,但当然,IE绝对无法使用它。是否有支持XMLDOM的库:getAttributeNS本地名称namespaceURI对IE7的支持是我需要的。 最佳答案 您可以使用jQuery在InternetExplorer中安全、轻松地解析XML。本教程EasyXMLConsumptionusingjQuery将为您提供有关如何操作的更深入的信息。 关于javascript-用于使用命名空间解析XML的Java